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6&10/064&34, 3 차 원 모델링, 가 상 현 실 , 그리고 의학 영 상 의 처리 속 도 를 높이기 위한 3 차 원 가 속 기 에 대한 
많은 연 구 들이 진행 중이다. 본 논 문 에 서는 3 차 원 그래픽 처 리 속 도 를 향 상 하기 위하여 50041 처 리기 구 조 의 
3 차 원 가 속 기 를 제 안 하 며 , 기 존 의 풍 음 영 법 을 제 안 된 구 조 에 맞게 병 렬 화 하고 수 행 함 으로써 직접적인 성 능 분 
석 을 시 도 하 였다. 3 차 원 50000 처리기 구 조 는 261 지역 버스 인터페이스, 16 개 의 처리기, 그리고 220<'5 
다 중 접 근 기 억 장 치로 구 성 되며, 다 중 접근 기 억 장 차는 17 개 의 외부 메모리 모 듈 을 갖는다. 기 존 의 직렬 풍 음영 
법 을 51441 처리기 구 조 에 수 행 될 수 있도록 하 나 의 다 면 체 를 여러 개의 4%4 의 정방형 다 면 체 로 나누어서 
처 리 하는 병렬 폼 음 영 법 으로 수 정 하였으며, 하 나 의 정방형 다 면 체 는 다 중 접 근 기 억 장 치 가 간 격 이 1 인 블록 
접 근 이 가 능 하 기 때문에 16 개 의 처 리 기 가 동시에 처 리 할 수 있다. 60011 처리기 구 조 에서 수 행 되는 병 렬 화 된 
풍 음 영 법 을 하드웨어 모 의 실 험 패 키 지 인 (101 사 의 ㅠ 60108-※Ｌ 로 모 의 실 험 을 수 행 한 결과 5.14 배 의 
속 도 향 상 을 보 임 을 확 인 하 였다. 
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1. 서 론 보 편 화 로 삼차원 그래픽 처 리 에 의한 그래픽 응 용 이 
날로 확 대 되어 가고 있 다 [1]. 01004, 30 모델링, 

컴 퓨 터 의 속도 증 가 와 다양한 그래픽 사용 환 경 의 가 상 현실, 게임, 영화, 의료 분야 등과 같은 영상 매체 
급속한 발 전 으 로 인한 고해상도 그래픽 사용 환 경 의 와 관련된 응 용 분 야 는 기 존 의 2 차 원 아날로그 415: 
( 제 2000261 그 616 뷔 9100 87966 (>070101066) /2Ｌ1.(0 카 1456 
" 정회원, 충 남 대 학교 컴 퓨 터 공학과 스 66008000 67 Ｌ ㄴ 106) 급 영 상 처 리 기 술 에서 3 차 원 디 


" 한 국 전 자 통 신 연구원 선 임 연구원 . 0 , ' 
아 빼 대 본 방배 아아 오 시 공 하 가 지 털 11101 01101 10601010400 그 81615100) 급 영상 처 


리 기 술 로, 개별 매 체 로 취 급 되 던 오디오, 비디오, 그 
래 픽스 및 텍스트 둥이 복합 매 체 로 취 급 되는 등 [3], 
향상된 고 기 능 화 , 고 품 질 화 및 실시간 처 리 로 진 행 되 
어 나아가고 있다. 이러한 현 상 은 오디오, 비디오, 그 
래 픽 과 같은 멀티미디어 데이터 처 리 기 술 과 멀 티 미 
디어 영 상 정보 저장, 전송 및 가 공 을 위한 하드웨어 
와 소 프 트 웨 어 의 통합 기 술 로 지 칭 되 는 차세대 영상 
정 보 처리 기 술 을 절 실 하 게 요 구 하 게 되었다. 이러한 
시대적, 기술적 요 구 사 항 을 만 족 시키기 위해서는 그 
래 픽 측 면 에 서 영상 데이터 처 리 량 의 기 하 급 수 적 인 
증 가 와 더불어 실시간 처 리 가 요 구 되어 졌다. 그러 
나, 특정한 삼차원 그래픽 알 고 리 즘 의 경우, 복 잡 하 
고 다양한 기 법 으로 처 리 되지만 반 면 에 대 규 모 의 반 
복 연 산 이 요 구 되기 때문에 삼차원 그래픽 처 리 를 
실 시 간 으로 처 리 하 기 가 어려운 부 분 들이 많다. 

삼차원 그래픽 처 리 에 관련된 여러 가지 알고리즘 
중에서 일 반 적 으로 풍 음 영 법 ( 바 008 5180108)[3] 은 
삼차원 그 래 픽 을 이루는 다 면 체 (2017800) 의 음 영 과 
반사 효 과 를 광 원 과 시 각 의 방 향 에 따른 각 화소 
(01×61) 별 계 산 올 수 행 해 야 하는데, 삼차원 그 래 픽 처 
리 기법 중에서 실 시 간 으로 처 리 하 기 어려운 부분 
중의 하나이다. 다양한 삼차원 화면 처리 기 법 을 실 
시 간 으로 처 리 하 기 위한 방 법 에 관련된 다양한 알고 
리 즘 [9] 및 소 프 트 웨 어 들이 제 안 되고 있으며, 또한 
소 프 트 웨 어 의 한 계 성 올 극 복 하 기 위하여 하드웨어 
에 의한 처리 방 법 [6] 둥이 지 속 적 으로 연구 개 발 되 
고 있다. 

본 논 문 은 다양한 삼차원 그래픽 알 고 리 즘 의 실시 
간 처 리 를 위한 하드웨어 구현, 즉 , 삼차원 그래픽 
가 속 기 에 관한 것 으 로 써 대 규 모 의 다 중 접근 기 억 장 
치 [5] 와 다 수 의 연 산 기 로 구성된 500020(510816 
10616040660 544102016 10313) 처리기 구 조 를 제 시 한 다. 
또한, 제안한 가 속 기 의 성 능 을 검 증 하기 위하여 기존 
의 풍 음 영 법 을 토대로 병렬 처 리 가 가능한 방 법 을 
제 시 한다. 이는 폼 음 영 법 이 아직도 널리 적 용 되고 
있으면서 많은 처리 시 간 을 요 구 하고, 또한, 다른 그 
래 픽 관련 응용 프 로 그 램 에 비하여 제안한 가 속 기 에 
이 식 하 기 가 수 월 하 기 때 문 이 다 . 

부 60108 +1101Ｌ([1470\216 106501700 ㅁ 010 1.30 ㅁ 84886) 
를 사 용 하여 제안한 가 속 기 를 모 델 링 하고 (1084 
사의 하드웨어 모 의 실험 패 키 지 인 60108-※×Ｌ 을 사 
용하여 본 논 문 에서 제안한 음 영 법 처리 방 법 이 
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제안한 가 속 기 에 의하여 실 시 간 으로 수 행 됨을 검증 
하였고, 또한, 3 차 원 그래픽 처 리 를 위한 다양한 방법 
들 도 병렬 알 고 리 즘 을 적용한 가 속 기 에 의하여 실시 
간 처 리 의 가 능 성 을 제 시 한 다. 

본 논 문 의 진 행 은 다 음 과 같다. 제 2 장 에서는 삼차 
원 그래픽 가 속 기 의 연구 개발 동 향 을, 제 3 장 에서는 
8000 처리기 구 조 를 갖는 3 차 원 그래픽 가 속 기 를 
제 안 한 다. 그리고, 제안한 가 속 기 의 성 능 을 검 증 하 기 
위해 특정 알 고 리 즘 으로 선 정 된 폼 음 영 법 의 이론적 
배 경 과 병렬 처 리 의 필 요 성 에 관하여 제 4 장 에서 기 
술 한다. 제 5 장 에서는 동 음 영 법 을 병렬 처 리 하기 위 
한 방 법 을 제 시 하 고, 제 6 장 에서는 제 5 장 에서 제안 
한 방 법 으로 구 현 한 풍 음 영 법 을 제안한 가 속 기 에 
적 용 하여 모 의 실 험 하 고, 모 의 실 험 으로부터 얻은 결 
과 를 토대로 성 능 을 분 석 하 였다. 마 지 막 으로, 제 7 장 
에서는 결 론 을 내린다. 


2. 삼차원 그래픽 가 속 기 의 연구 개발 동향 


일 반 적 으로 삼차원 그 래 픽 을 처 리 하 는 프로그램 
이나 삼차원 그래픽 가 속 기 의 성 능 은 삼차원 그래픽 
의 기본 요 소 인 다 면 체 를 초당 처 리 할 수 있는 개수 
로 표 시 될 수 있 는 데 [1], 삼차원 그래픽 알고리즘 처 
리 는 복잡한 부동 소수점 연 산 을 각 화 소 마 다 반복적 
으로 계 산 되어야 하기 때문에 성 능 의 중 가 에는 한계 
성 울 갖고 있다. 

대 표 적 으로 800 8416805756601517] 사는 이러한 문 
제 를 해 결 하기 위한 방 법 으로 4 개 의 부동 소수점 연 
산 자 로 구성된 부 동 소수점 처 리 기 (10804108 『 이 0 
10010 가 4 개 로 구 성 되 어진 그래픽 가속기 구 조 를 제 
안하고 있 으 며 (그림 1-3), 471 사는 그 래 픽 의 연산 
부 분 을 수 행 하 기 위하여 여러 개의 엔 진 으 로 구성된 
가 속 가 에 수 행 할 알 고 리 즘 올 여러 단 계 로 나누어 각 
각 의 엔 진 에 서 할 당 하 여 각 단 계 들 이 순 차 적 으로 처 
리 되는 구조 등 이 제 시 되 고 있다. 그리고, 30 Ｌ ㄴ 868 
사는 64 비트 17060-20100601060 구 조 와 2 개 의 연 산 기 
로 그래픽 데 이 터 를 처 리 하 는 구조 등 을 제 시 하고 
있다. 이러한 기 존 의 가 속 기 들의 공통된 특 징 은 순차 
적인 프 로 그 램 의 수 행 을 기 본 으로 하고, 프 로 그 램 의 
일부 알고리즘 처 리 를 복 잡 하게 구 현 된 연산 처리기 
에 분 배 하여 처 리 하 는 구 조 를 갖고 있 다 (그림 1- ㅁ ). 
그러한 방법 외의 추가적인 방 법 들 은 연 산 의 처 리 를 
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교 림 1. (3) 540 04110 ㅠ 05\516100, (0) ㅅ ^11 에 서 제안한 삼차원 그래픽 가속기 구조. 


버 068060 기 법 [2] 을 사 용 하여 처리 속 도 를 중 대 시키 
는 방법, 가속기 내의 버스 폭 을 늘려 1 회 의 입출력 
데 이 터 량 을 늘리는 방 법 [11] 등 이 사용되고 있다. 

이러한 구 조 들은 다 음 과 같은 단 점 들을 갖고 있는 
데 , 첫 째 는 병 렬 화 의 단 위 가 크고, 둘 째 는 구 조 상 으 
로 확 장 성 이 없다. 그리고, 영 상 의 기본 구 조 인 화소 
를 직접 사 용 하지 않고 직렬 수행 방 법 에 의한 좌표 
계 산 을 매 프로그램 시마다 수 행 해 야 한다. 그래서, 
각 화 소 에 관련된 데 이 터 를 직접 화 소 별 로 처 리 하지 
못하고, 이를 해 결 하기 위한 좌표 변 환 이 많은 처리 
시 간 을 요 구 해 서 전 반 적 으로 처리 속 도 의 향 상 에 한 
계가 있다. 이러한 한 계 성 을 극 복 하기 위해서는 고도 
의 병 렬 성 , 데 이 터 와 화 소 간의 일 치 성 을 보 장 하여 연 
산 데 이 터 와 영상 데이터 사 이 의 매 핑 (0180008) 시 
간 을 줄 임 으로써 가 능 하 다. 따라서, 앞으로 연구 개 
발 될 삼차원 그래픽 가 속 기 는 파 이 프 라인 기 법 [2], 
병 렬 화 기 법 [5], 연산 데 이 터 와 영상 데 이 터 를 동일 
하게 처리 할 수 있는 기 술 의 혼 합 된 구 조 [1] 로 구현 
될 것이다. 


3. 3 차 원 그래픽 가속기 구조 


본 논 문 에서 제안한 3 차 원 그래픽 가 속 기 는 51411) 
구 조 로써 호 스 트 와 데이터 및 명령 전 송 을 위한 201 
(06006『31 (;6001000614[ 17160000 ㅁ 60000) 버스, 처리 
기 들, 그리고, 다 중 접근 기 억 장 치로 구 성 되었으며, 
그럼 와 같다. 
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그림 2. 제안한 3 차 원 그래픽 가 속 기 를 위한 518/0 처리기 
구조 


방대한 양 의 데 이 터 를 효 율 적 으로 수 행 하 기 위해 
서 200<'5 다 중 접 근 기 억 장 치 [4.9] 를 가 속 기 의 메모 
리 구 조 로 써 적 용 하였는데, 이는 효율적인 메모리 접 
근 모 드 를 제 공 하여 여러 개의 처 리 기 들 로부터 출력 
데 이 터 를 화 면 의 1024×764 화 소 와 1 대 1 로 대 응 시키 
기 위한 별 도 의 계산 없이 프레임 메 모 리 ( ㅠ 8006 
때 60007) 와 연산 결 과 를 일 치 시킬 수 있으며, 
( ㄷ ,0)-68500 도 메 인 에 적합한 논 리 적 인 2 차 원 메모리 
접근 방 식 을 제 공 하기 때 문 이 다 . 

다 중 접근 기 억 장 치는 메모리 모듈 선택 회로, 데 
이터 입출력 라우팅 회로, 주소 계산 및 라우팅 회로, 
그리고, 메모리 모 듈 로 구 성 되어 있 으 며 ( 그 림 3), 블 
록 , 행 , 열 모 드 의 다양한 간 격 으로 메 모 리 에 접 근 할 
수 있는 기 능 을 제 공 한 다. 4×4 정방형 다 면 체 를 처리 
하기 위해서 다 중 접근 기 억 장 치 를 통해 간격 1 의 블 


록 모드 방 식 으로 16 개 의 처 리 기 들이 동시에 프레임 
메 모 리 에 접 근 할 수 있다. 
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그림 3. 다 중 접 근 기 억 장 치 의 블 록 도 


201 인 터 페 이 스 는 1288 ㅠ [65/5 의 전송 속 도 로 데 
이터 전 송 을 수 행 하며, 처 리 기 들은 알 고 리 즘 의 최종 
연 산 부를 수 행 하 도록 설 계 하 였다. 다 중 접근 기 억 장 
치를 16- 비 트 칼 라 를 표현할 수 있도록 최대 1024<764 
크 기 의 프 레 임 을 지 원 하 도록 구 성 하였다. 201 인터 
페 이 스 에서 생 성 되는 어 드 레 스 와 데이터 신 호 는 
0201 인터페이스 내의 제어 및 상태 레 지 스 터 와 
81501 처 리 기 가 공 유 하 고 있으며, 201 인터페이스 
내의 레 지 스 터 는 처리기 제어 레 지 스 터 와 처리기 상 
태 레지스터, 그리고, 83566 ^007655 레 지 스 터 로 구 
성 되어 있다. 8856 ^001655 레 지 스 터 는 201 인 터 페 
이스 규 격 의 초기화 과 정 에서 201 버스 탓 모 드 로 
동 작 할 경 우 에 는 메모리 맵 의 번 지 를 기 입 하게 되어 
있는데 본 논 문 에서 설 계 한 201 버스 인 터 페 이 스 는 
[60077 104820060 1) 모 드 로 엑 세 스 하 는 것을 기본 
으로 하였다. 따라서 기 입 된 어 드 레 스 의 상위 8 비트 
(3007 [31:24]) 의 값 을 보드 선 택 의 비교 값 으로 사용 
하도록 하였다. 실 제 적 인 연산 처 리 를 담 당 하는 처리 
기 들은 4 개 의 처리기 그 룹 으 로 구 성 되었으며 각 각 의 
처리기 그 룹 은 4 개 의 처 리 기 와 제 어 장 치 로 구 성 되었다. 

다 중 접근 기 억 장 치 에 저장된 데 이 터 를 한번에 읽 
어 출 력 되 는 크 기 를 최대 2, 16 2 ㅠ [65 가 가 능 하 도록 
하였다. 그러나, 201 버 스 는 32 비 트 버 스 이기 때문에 
출력 데 이 터 를 한번에 읽을 수 없고 8 번 에 걸쳐 나누 
어서 읽어야 한다. 그래서, 201 인 터 페 이 스 의 로컬 
데이터 라 인 과 다 중 접 근 기 억 장 치 의 연 결 은 16 ㅁ 
2 %100※× 기 능 을 갖는 버 퍼 로 연 결 되었다. 

처 리 기 는 그 래 픽 에 관련된 복잡한 연 산 들을 하드 
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와 이 어 (1370\1160) 로 직 으로 수 행 한다. 따라서 처리 
기는 복 수 의 곱셈기, 덧 셈 기 의 조 합 으 로 구 성 되어 있 
으며, 연 산 의 단계별 데 이 터 는 별 도 의 레 지 스 터 를 사 
용하여 저 장 한 다. 그리고, 제어 메 모 리 는 최초 연산 
기에 필요한 입력 데 이 터 를 읽 어 오는 경 우 에만 접근 
하고, 연 산 에 필요한 초 기 값 을 읽 어 들 인 이 후 에 는 접 
근 하지 않는다. 또한, 처 리 기 는 상태 제어기 형 태 로 
구 현 되며, 연산 속 도 의 증 가 를 위해 2 개 의 산 술 논 
연 산 장 치 (410 : 2417010171606 1 ㄴ 0816 4 ㅁ 01[) 를 두어 계 
산 속 도 를 2 배 로 늘 리 도록 구 성 하 였 다 (그림 4). 상태 
제 어 기 는 제어 메 모 리 로부터 입 력 되는 데 이 터 를 피 
연산자 레 지 스 터 ((0060000 ㅁ 6818[6「) 에 저 장 하 고 데 
이 터 의 흐름 및 ^Ｌ11 의 동작 모 드 를 제 어 하 며 , 최종 
연산 결 과 를 다 중 접 근 기 억 장 치 로 출 력 하도록 구 성 되 
었다. 
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그림 4. 2 개 의 ^Ｌ ㄴ 를 갖는 5 구 조 의 블 록 도. 


4. 풍 음 영 법 ( 마 1009 58 120100) 


풍 음 영 법 은 주사선 상의 모든 점 에서 표면 법선 
의 근 사 값 을 계 산 한 후 근사 법 선 을 사 용 하여 광 도 를 
계 산 하 는데, 이 방 법 은 법선 벡터 보 간 방 식 (0070281- 
76060 106600018000 5062006) 이 라고도 한다. 풍 음영 
법 은 먼저 주사선 상의 경 계 점 들 의 법선 벡 터 를 보간 
한다. 그림 5 에 서 보이는 다 각 형 에 서 의 점 5 의 법선 
벡 터 는 정점 1 과 정점 2 에 서 계 산 된 법 선 으로부터 
보 간 되고, 점 6 의 법 선 은 정점 1 과 정점 4 의 법 선 으 로 
부터 계 산 된다. 주 사 선 (6030 1106) 상의 모든 내 부 점 
들은 정점 5 와 정점 6 의 법 선 으로부터 보 간 된 법 선 이 
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부 여 된다. 이렇게 함으로써 정 점 들 로 부터 직접 보간 
한 광 도 보 다 더 정확한 결 과 를 얻을 수 있다. 
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그림 5. 다 각 형 을 지나는 주사선 상의 내 부 점 7 의 법 선 은 정 
점 5 와 6 의 법 선 으로부터 보간 된다. 


대 부 분 의 경우 실 시 간 으 로 음 영 처 리 를 수 행 하 기 
위해서 구 로 우 음 영 법 을 이 용 하 지만, 표 면 의 하 이 라 
이 트 가 때로는 비정상적인 형 태 로 비 추 어 지 며 선형 
광도 보 간 법 때문에 마 하 띠 (0434 8800) 라 고 하는 
밝 거나 어두운 광 도 의 떠 가 표 면 에 있을 수 있다. 풍 
음 영 법 은 이러한 140460108 04[ 과 0411 54866 를 제 
거 하 고 마 하 떠 를 축 소 시켜 고 화 질 의 하 이 라 이 트 를 
표현할 수 있기 때문에 현 실 감 을 살릴 수 있지만, 일 
반 적인 음 영 법 은 각 화 소 마 다 3 번 의 덧셈, 1 번 의 
나 늦 셈 , 그리고 1 번 의 평 방 근 을 필 요 로 하기 때문에 
실시간 처 리 가 어 렴 다 [10]. 이러한 많은 계 산 량 을 줄 
이기 위해서 제시된 빠른 음 영 법 0889[ 바 008 
야 130108) 은 각 화 소 마다 램버트 반 사 (1.4701[6 ㅁ 7130 
16060007) 을 위한 2 번 의 덧 셈 과 그 외에 5 번 의 덧셈 
과 1 번 의 메모리 접 근 (0760107＊ 800655) 을 필 요 로 한 
다 [10]. 그렇지만, 기계어 레 벨 에서 수 행 되는 연 산 올 
분석해 보면 일반적인 음 영 법 [15] 을 수 행 하기 위 
해서는 하 나 의 화 소 마다 23 개 의 부동 소수점 곱셈, 
4 개 의 부동 소수점 나 늦 셈 , 7 개 의 부동 소수점 덧셈, 
그리고, 1 개 의 제곱근 연 산 을 수 행 해 야 한다. 


5. 풍 음 영 법 을 고속 처 리 하기 위한 병 렬 화 방법 


대 부 분 의 삼차원 그래픽 처 리 는 각 각 의 다 면 체 를 
처 리 하 는데, 음 영 법 에서도 각 각 의 다 면 체 를 하 나 의 
단 위 로 취 급 하여 음 영 처리 한다. 다 면 체 의 크 기 와 모 
양은 일 정 하지 않으나 다 각 형 눈 그물 표 시 법 (2017800- 
107@ 아 1 16076960[3000) 으 로 표 현 된 대 부 분 의 모 델 은 


삼각형 또는 사각형 모 양 의 다 면 체 들 로 구 성 된 다. 사 
각형 모 양 의 다 면 체 들 로 표 현 된 모 델 의 음 영 을 나타 
내기 위하여 폼 음 영 법 을 적 용 할 경우, 화 소 에 따른 
법선 벡 터 를 계 산 하기 위한 일 련 의 연 산 들 이 다면체 
내의 화소 수 만 큼 반 복 적 으로 처 리 되 어야 한다. 주사 
선 상의 모든 화 소 의 법선 벡 터 를 계 산 함으로써 다면 
체 내 부 의 화 소 들 에 대한 법선 벡 터 를 구할 수 있는 
데 , 이러한 방 법 에서는 다 면 체 들의 형 태 가 다 양 하기 
때문에 한 정 점 올 교 차 점 으로 서로 다른 두 정 점 을 
잇는 두 개 의 직 선 과 주 사 선 이 교 차 하는 점 들 의 개수 
가 일 정 하 지 않은 경 우 가 빈 번 하게 발 생 한 다. 즉 , 다 
면 체 를 이루는 임 의 의 서로 다른 정점 1, 2, 3 으 로 부 
터 정점 1 과 정점 2 를 잇는 직 선 상의 점 들 을 집합 
4, 정점 1 과 정점 3 을 잇는 직 선 상의 점 들 을 집합 
끄 그리고, 주 사 선 이 *< ㄷ 4 이 고 71 ㄷ 2 이 며 추인 단 
사 함 수 (10160076 14000070)7~)=# 로 표 현 되 어 진 다 면 
모든 × 에 대하여 함수 를 만 족 하는 어떤 / 의 집합 
2' 과 집합 교 사 이 에 2' ㅇ ㄴ 2 인 관 계 가 성 립 된 다. 병렬 
화 의 단 위 가 다 면 체 보다 작은 크 기 로 나 누 어 질 경우, 
7 ㄷ 2-2' 를 만 족 하기 위한 ㅠ ” ㅎ 4 인 ×' 를 계 산 하기 
위한 오 버 혜 드 (00641680) 가 발 생 하기 때문에 일관성 
있는 병 렬 화 처 리 에는 부 적 합 하다. 그래서, 일반적인 
가 속 기 에 서는 다 면 체 를 하 나 의 처리 단 위 로 간 주 하 
고, 다 면 체 을 형 성 하 는 각 정 점 들의 법선 벡 터 를 가 
속 기 에 전 송 하여 처 리 하도록 한다. 처 리 된 데 이 터 는 
다시 각 화 소 에 따른 좌 표 를 다시 계 산 해 야 한다. 이 
렇 게 계 산 된 좌 표 와 일 치 하 는 비디오 메 모 리 에 화소 
의 법선 벡 터 를 저 장 함 으로써 모든 과 정 이 완 료 된 다. 
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그림 6. (8) 다 면 체 를 4>×4 의 정방형 다 면 체 로 분할 (6) 정방 
형 다 면 체 와 마스크 레지스터 


본 논 문 에서는 앞서 언 급 한 문 제 들을 해결할 수 
있는 병 렬 처리 방 법 을 제 시 한다. 병 렬 화 를 위해서는 
다 면 체 가 일정한 크 기 와 규 칙 적 인 배 열 성 을 갖고 있 
어야 한 다 [4]. 이러한 규 칙 성 , 배 열 성 , 일정한 크 기 를 


부 여 하기 위하여 본 논 문 에서는 주어진 다 면 체 를 다 
시 4%4 개 의 화 소 을 갖는 정 방 형 의 다 면 체 로 분 해 하 
는 방 법 (그림 6-8) 을 적 용 한 다 . 이러한 방 법 을 적용 
하기 위해서, 호스트 컴 퓨 터 는 처 리 해 야 할 데 이 터 를 
4839 의 크기 단 위 로 법선 벡 터 를 계 산 한다. 예 를 들 
면 , 좌표 (×, )) 과 (×+47, ) 의 법선 벡 터 를 계 산 한다. 
이러한 연 산 을 반복 수 행 하여 48 × 쥐 개의 다 면 체 로 
재 구 성 하여 제안한 가 속 기 에 전 송 한 다. 제안한 가속 
기 내의 16 개 의 처 리 기 (2: 2『00655108 516060[) 가 
간 격 이 3 인 행 접 근 으로 데 이 터 를 읽어 온다. 이때, 
286 와 『5/ 만 이 호스트 컴 퓨 터 에 서 계 산 된 유효한 법 
선 벡 터 를 읽어 오게 된다. 읽어 온 2 개 의 법선 벡터 
를 토대로 281 과 『6. 는 동일한 법선 벡터 계 산 을 수 
행하여 간 격 이 3 인 행 접 근 으 로 데 이 터 를 저 장 한다. 
이렇게 4 번 에 걸쳐서 수 행 하게 되면 4%4 를 수 행 하 기 
위한 정방형 다 각 형 이 구 성 되고, 간 격 이 1 인 블록 접 
근 을 수 행 하 여 나머지 화 소 들의 법선 벡 터 를 계 산 한 
다. 이러한 수 행 은 처리기 그 룹 이 4 개 의 처 리 기 와 1 
개의 제 어 장 치 로 구 성 되어 있으며, 각 각 의 처 리 기 는 
처리기 그룹 내 에 서 몇 번째 처 리 기 인지, 16 개 의 처 
리기 내 에 서 몇 번째 처 리 기 인 지 를 알고 있다. 예 를 
들면, 두 번째 처리기 그룹 내의 두 번째 처 리 기 는 
그룹 내 에 서 는 두 번째, 전체 16 개 의 처리기 중에서 
여섯 번 째 임 을 알고 있다. 이는 폼 음 영 법 을 수 행 하 
기 전에, 초기화 단 계 에서 처리기 내의 레 지 스 터 에 
저 장 하기 때 문 이 다. 이러한 병 렬 처 리 를 수 행 하 기 위 
한 음 영 법 의 흐 름 도 는 그림 7 과 같다. 
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『070000416 
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ㅅ 0068101200 


바 1009 90860109 107 
6801 001/900 


바 009 50780109 10 
60801 「『7010900 


그림 7. 기 존 의 폼 음 영 법과 제안한 폼 음 영 법 의 병렬 방법 
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음 영 법 을 적 용 할 물 체 의 형 태 가 다 양 하고 제안한 
가 속 기 가 48 × 씨 형 태 를 전송 받아서 처 리 하 기 때문 
에 물 체 를 포 함 하는 최소 다 각 형 을 이루도록 하였으 
나 주사선 상에서 물 체 의 모 서 리 가 48 의 배 수 가 아닐 
수 있다. 이런 경우, 가 속 기 는 하 나 의 법선 벡터 
에 한 정 된 ) 를 읽 어 오 거나 또는 어떠한 법선 벡 터 도 
읽 어 오 지 못한다. 이러한 문 제 를 해 결 하기 위해서 호 
스트 컴 퓨 터 는 주사선 상의 특정 내 부 점 의 법선 벡터 
를 계 산 한다. 즉 , 모 서 리 에 가장 근 접 하 면서 시작점 
× 를 기 준 으 로 ×,+30 인 위 치 에 존 재 하는 내 부 점 의 법 
선 벡 터 를 계 산 한다. 이렇게 함으로써 특정 내 부 점 들 
은 제안한 가 속 기 예서 특정 에 읽 혀 지 게 되며, 제 
어 장 치가 마스크 비 트 를 체 크 하여 어떤 가 호스트 
컴 퓨 터 에 서 계 산 된 법선 벡 터 를 읽어 왔 는 지 를 알 
수 있다. 이 때, 간 격 이 3 인 행 접 근 으로 처 리 기 들 이 
데 이 터 를 읽 었 기 때문에 주사선 상의 모 서 리 에 대한 
법선 벡 터 는 가 속 기 의 메모리 내 부 에 저 장 되어 있지 
만 처 리 기 에 읽 혀 지 지는 않는다. 이와 같이 간 격 이 
3 인 행 접 근 으로 데 이 터 를 읽어 들이고 계 산 을 수행 
한 다음, 수 행 한 결 과 를 간 격 이 3 인 행 접 근 으 로 저장 
하는데, 좌 표 를 중 가 시켜 가면서 4 회 반복 수 행 하 
게 되면 가 속 기 의 메모리 내 부 의 데 이 터 는 4%4 정방 
형 다 면 체 로 재 구 성 되게 된다. 그래서, 간 격 이 1 인 
블록 접 근 을 통해서 484 내 의 16 개 의 데 이 터 를 읽게 
되는데, 첫 번째 처리기 그 룹 의 경 우 에 는 280 와 188 
이 이 전 에 계 산 된 법선 벡 터 를 읽어 왔 으 므 로 나머지 
151 과 286 의 법선 벡 터 를 계산할 수 있다. 이 때, 고 
려 해 야 할 문 제 는 모 서 리 를 포 함 할 경 우 이다. 이 경 
우도 앞선 경 우 와 마찬가지로 마스크 비 트 를 두 어 서 
해 결 하였다. 즉 , 그림 6-(6) 와 같이 4%4 정방형 다면 
체 내에 존 재 하 는 사선 밖의 화 소 에 대해서는 처리기 
로 하여금 연 산 을 수 행 하지 않도록 하기 위해 마스크 
비 트 (2185 0168) 를 두 었 으 며 , 마스크 비 트 의 값 이 '0' 
인 경 우 에는 해당 처 리 기 가 연 산 을 수 행 하 지 않도록 
하였다. 


6. 모의 실험 및 성능 분석 


모의 실 험 은 60108 1101.(81070\21 ㅇ 6 106601710007 ㅁ 
1Ｌ8084886) 을 사 용 하 여 51000 처 리 기 를 기 술 하고 
(6410830(\ 사 의 모 의 실험 패 키 지 인 ㅠ 6008-※Ｌ 을 
사 용 하 여 모 의 실 험 을 수 행 하였다. 그림 8 에 서 4 0 
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그림 8. 『 여 10081 8645 10161[806 에 의한 제어 메모리 데이터 입출력 파형. 


는 801 버 스 상의 어드레스 데이터 멀 티 플 렉 스 된 신 
호 아 며 , ㅇ _0 ㅁ 601_00 는 제어 메 모 리 (600 ㅠ ㅁ 01 0 ㅁ 60005) 
의 출력 데이터 이다. (1. 은 3380412 의 2 버스 주 
기 이 며 , 780, 『84585 6006, 퍼 20 
12086, 57072, 4000 20881 등 은 201 규 격 에 
의한 201 버스 인터페이스 신 호 선 들이다. 0670_\ ㄴ ㅠ _ 
선 호 는 51801 처리기 내의 모든 레지스터, 제어 메모 
리 , 다 중 접근 기 억 장 치 에 공 통 적 으로 적 용 되는 신호 
로써 06000” '1\ ㅁ (6 시 점 을 알 려 주 기 위한 시 점 이 며 , 
이 신 호 와 어 드 레 스 를 디 코 딩 하 여 접 근 하고자 하는 
모 듈 의 \1 ㅁ [6 6034016 신 호 로 사 용 한 다. 1845406_ 신 
호 는 201 버스 전 체 를 총 괄 하는 신 호 로 써 버스 구동 
의 시 작 과 끝 을 알 려 주 는 신 호 이다. 

설계된 희 로 의 정확한 성능 측 정 값 을 얻기 위해서 
는 일 반 적 으로 다 음 과 같은 과 정 을 거쳐야 한다. 설 
계 한 회 로 를 112[. 로 기 술 하 고, 모 의 실 험 을 통한 기 
능 을 검 정 을 거친 다음, 4510: 760007 가 제 공 하는 라 
이 브 러 리 로 합 성 을 수 행 한다. 그리고, 라 이 브 러 리 에 
서 제 공 되는 셀 (68]) 의 지연 시 간 (0027 0 ㅁ 006) 을 계 
산 하 여 모 의 실 험 올 수 행 한 후 실제 로 직 이 적 재 될 
ㅅ ^9816 760007 가 제 공 하 는 3830-600 7'001 을 사 용 하 
여 칩 의 다 이 (06) 에 서 의 1370 나 이 이루어진 상 태 에 서 
의 0004008 0612 와 13004 0013* 를 포함한 지연 시간 
을 계 산 하 여 모 의 실 험 을 수 행 해 야 하는 830-600 
과 정 을 거쳐야 한다. 그러나, 본 논 문 에 서 제안한 삼 
차원 그래픽 가 속 기 는 6 ㅁ 108@-*※Ｌ 를 사 용 하여 기능 
검 증 을 위한 모 의 실 험 을 수 행 하 여 하드웨어 구현 시 


예 상 되는 속 도 롤 측 정 하 였는데, 이는 1707[-800 과 
정 만 을 거친 단순 지 연 시 간 (06132 0106) 을 사 용 하 여 
성 능 을 예 측 한 것이다 


예 측 된 성 능 을 바 탕 으로 1 개 의 다 면 체 (64 01×019) 
처 리 에 대하여 120540112 에 서 동 작 하는 ?67018040 
170065507 를 장 착 한 (와의 성 능 을 비교 분 석 하 였 
다. 즉 , 제어 메 모 리 에 4%4 화 소 로 정 규 화 된 다 면 체 로 
형성된 데 이 터 가 61441 처 리 기 로 전 달 되어 에서 
수 행 한 후 다 중 접근 기 억 장 치 에 저 장 될 때 까 지의 수 
행 시 간 (7.60000 과 『 ㅁ (에서 직렬 프 로 그 램 을 수 행 하 
여 디스플레이 장 치 로 데 이 터 를 넘 겨 주 기 까 지 걸리 
는 수행 시 간 (7:60) 을 1 개 의 다 면 체 를 바 탕 으로 비 
교 하 였 다. 


32 / 12 $ 
9 히히 400 + 27 “0 _ 채 고 + > 90] 
02240 1207 ^8+ 이" 100 7 호 116} 회 70900 + 1146 12 + 


여기서, 7826.400-10079, 77 412 ㄱ 30705, 1726.276=45075, 
0834=70/775 인 데 , 이들 값 은 120804112 에 서 동 작 하 는 
6 로 부터 얻은 값 이고, 744080-209, 740= ㅋ 1205, 
720/6-32779, 7144485-210, 776 7-33)79 는 으 00010 처 리기 
를 ^451(: 으 로 구 현 했을 경 우 를 가 정 하 여 얻은 값 이 
며 , 와 6 는 연 산 기 처리 시간 이 외 의 기타 지연 
시 간 들 을 고려한 변 수 들 인데, 특히, 6 는 구 현 상에서 
발생할 수 있는 제 어 를 위한 동기 확 립 을 위한 지연 
시간 등에 관한 변 수 이다. 만약, 0 = 6 라고 가 정 할 
경우, 724 는 32.48075, 7)2000 는 -2.800725 이 며 , 
981401 처 리 기 가 11.6 배 의 속도 향 상 을 보였다. 만약, 
덧 셈 기, 곱셈기, 그리고, 나 늦 셈 기가 500441 처 리 기 를 
구 현 한 4516 소 자 와 같은 처 리 속 도 를 갖 는 다 고 한 
다면 7.60=14,408/85 이 며 , 이런 경 우 에서는 50541) 처 
리 기 가 5.14 배 의 속도 향 상 을 보인다. 


7. 결 론 


본 논 문 에서는 51401) 처 리 기 에 적 합 하고 병 렬 화 
가 가능한 옹 음 영 법 을 제 안 하였고, 풍 음 영 법 을 처 
리 하 는 부분 중 반 복 적 이면서도 연 산 량 이 많은 부분 
을 50411 처 리 기 에서 병 렬 로 수 행 함 으로써 속 도 면 
에서 성 능 이 상당히 향 상 되었음을 볼 수 있었다. 그 
리고, 병 렬 화 된 부 분 의 수 행 을 위해 51441 처 리 기 를 
개 발 하였고, 직접 모 의 실 험 을 함으로써 병렬 수 행 이 
가 능 함 과 동시에 하 드 웨 어 로 구현 할 수 있 음 을 보였 
다. 또한, 제 안 된 51501) 처리기 내의 처 리 기 그 룹 의 
개 수 를 늘 림 으로써 더 많은 용 량 의 다면체 처 리 가 
가 능 하 며 , 처리 속 도 를 더욱 향 상 시키기 위한 처리기 
의 확 장 성 을 충분히 고려할 수 있었다. 

본 논 문 에서는 처 리 기 가 처 리 하는 수 행 부를 롱 음 
영 법 으로 제 한 하 였지만, 삼차원 그 래 픽 에서 적 용 되 
는 대 부 분 의 알 고 리 즘 이 다면체 단 위 로 이 루 어 지 므 
로 임 의 의 다 면 체 를 정방형 다 면 체 로 나누어 병렬 
처 리 하는 방 법 의 적 용 이 가 능 하 다. 따라서, 다양한 
삼차원 그래픽 알 고 리 즘 을 지 원 하 는 삼차원 그래픽 
가 속 기 를 구 현 하기 위해서는 본 논 문 에서 제 시 한 병 
렬 처리 방 법 을 적 용 하고, 처 리 기 가 각 알 고 리 즘 에서 
공 통 적 인 연산 부 분 과 수 행 과 정 을 모두 수 용 할 수 
있도록 설 계 되면 각 처 리 기 가 화 소 단위 처 리 를 수행 
할 수 있다. 이 경우, 처 리 기 의 효 율 을 극 대 화 하 기 
위해서 다 중 접근 기 억 장 치 가 제 공 하 는 다양한 간격 
을 허 용 하는 접근 모드 방 식 으로 동시에 다 면 체 를 
엑세스 할 수 있어야 한다. 

앞 으 로 의 과 제 는 제안한 병 렬 화 방 법 을 범 용 으로 
적 용 하 기 위한 처 리 기 의 개 량 과 201 인터페이스 통 
과 에 따른 전송 속도 저 하 를 방 지 하 기 위하여 다 중 접 
근 기 억 장 치 와 비디오 메 모 리 를 일체화 할 수 있는 
구 조 의 연구 둥이 진 행 되어야 할 것이다. 
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이 형 


1995 년 2 월 충 남 대 학교 컴 퓨 터 과 
학과 졸업, 이 학 사 

1997 년 2 월 충 남 대 학교 컴 퓨 터 공 
학과 졸업, 공 학 석사 

2000 년 2 월 충 남 대 학교 컴 퓨 터 공 
학과 박 사 과정 수료 

1. 케 관 심 분야 : 영 상 처리, 병 렬 처리, 

반도체 설계 


1986 년 2 월 한 양 대 학 교 전 자 공학 
과 졸업, 공 학 사 

1985 년 12 월 -1986 년 1 월 삼성전 
자 종 합 연 구 소 연구원 

1986 년 2 월 현재 한 국 전 자 통 신 연 
구원 선 임 연구원 

관 심 분야 : 이동 통신 변 복 조 모 

템 설계, 영상 신호 처리 


박 종 원 


1979 년 2 월 충 남 대 학교 전 자 공학 
과 졸업, 공 학 사 
1981 년 2 월 한 국 과 학 기 술 원 전산 
학과 졸업, 전산학 석사 
1991 년 8 월 한 국 과 학 기 술 원 전산 
학과 졸업, 전산학 박사 
1995 년 ~ 현 재 충 남 대 학 교 공과대 
학 정 보 통 신 공 학과 정교수 
관 심 분야 : 영 상 처 리 , 병 렬 처리, 의공학 


